等距假设 – 序数变量的计算

在处理序数变量时,等距假设 (Assumption of Equal Intervals) 指的是假设相邻答案类别之间的距离在受访者的感知中是相等的。这个假设试图证明将序数变量视为度量变量是合理的。这样做,就可以对序数变量计算均值 (means)、标准差 (standard deviations) 和 皮尔逊相关系数 (Pearson correlations)。这比使用更合适的技术要简单。

等距假设 – 示例

假设我们有一个变量,旨在衡量客户满意度,答案类别如下:

  • 非常差 (1)
  • 差 (2)
  • 中性 (3)
  • 好 (4)
  • 非常好 (5)

现在我们有两位男性受访者,分别选择 2 和 4,还有两位女性受访者,都选择 3。市场人员想知道男性是否比女性更满意。但是,答案是我们不知道。 这是因为我们不知道 “2: 差 (Bad)” 和 “3: 中性 (Neutral)” 之间的差异(或任何其他答案)在受访者的感知中是多少。“感知 (Perception)” 没有任何固定的测量单位。(由于答案类别的顺序是无可争议的,所以我们认为这是一个序数变量。)

假设等距

如果假设答案之间的间隔是相等的,那么序数变量就会被当作度量变量来处理。现在我们可以简单地计算出,男性平均得分 (2 + 4) / 2 = 3,女性平均得分 (3 + 3) / 2 = 3。 这就回答了市场人员提出的“无法回答”的问题。 皆大欢喜了吗? 未必。

如果假设不成立怎么办?

等距假设

但是,如果间隔在受访者的感知中是不相等 (unequal) 的呢? 假设后者通过以下值真实地反映出来(参见插图):

  • 非常差 (1)
  • 差 (1.5)
  • 中性 (2.25)
  • 好 (3.5)
  • 非常好 (5)

如果情况确实如此,那么男性实际上满意 (1.5 + 3.5) / 2 = 2.5,而女性为 (2.25 + 2.25) / 2 = 2.25。 因此,之前得出的结论具有误导性。

结论

根据某些学术标准,做出等距假设是不合理的做法,并且严格禁止。 但是,在现实生活的研究中(取决于你的领域),它可能很常见。 至少要意识到这种争议,并记住你在做什么。